查看原文
其他

汤晓鸥:一位被人工智能事业耽误的“脱口秀大师”

丁广胜 网易智能 2019-04-06

编者按:2018年12月28日,由网易智能、清华大学数据科学研究院和25家评审机构共同评出的「2018中国AI英雄风云榜」年度人物榜单揭晓,10位人工智能领域的从业者获奖。其中,商汤科技创始人、香港中文大学信息工程系教授汤晓鸥荣获技术创新人物大师奖。



文|丁广胜


“他是被人工智能耽误的脱口秀大师。”


听过很多场汤晓鸥的演讲,嘉宾和好友都发出过类似的感叹,不同于枯燥难懂的学术会议,汤晓鸥总能寓教于乐,讲懂技术还能带给观众欢乐。


“实际上我们做学术的是有骨气的,就是说不能为五斗米折腰,但你如果有六斗的话。”


“阿里讲让天下没有难做的生意,做人工智能的得讲让天下没有难吹的牛。”


“这次演讲,我准备了100页PPT,大概会讲8个小时(午饭时间)。”


他还曾回应称我不是段子手,段子手是为搞笑而搞笑的,“我只是幽默,是看到事物的本质”。


正是对科学本质的不懈追求,让汤晓鸥成为最有趣的科学家。


01

萌芽:从图画书到学术大牛


作为科学家,汤晓鸥目前担任香港中文大学信息工程系教授,同时还担任中国科学院深圳先进技术研究院副院长。作为创业者,汤晓鸥是商汤科技创始人。


汤晓鸥很小就对图像产生了浓厚的兴趣,看了大量的图画书,他曾对南方都市报表示,这也许是他以后从事计算机视觉研究的萌芽。


1990年,他获得了中国科学技术大学学士学位,第二年,汤晓鸥前往美国深造并获得罗切斯特大学硕士学位,1996年攻读了麻省理工学院(MIT)博士,在MIT期间他曾加入海底机器人实验室。博士毕业之后,他回国在香港中文大学信息工程系任教,还在微软亚洲研究院工作了三年,从事计算机视觉相关的研究。


2009年,他和其博士研究生何恺明(也是本次AI英雄风云榜技术创新人物新锐奖获得者),联同微软亚洲研究院的孙剑博士,凭论文“基于暗原色的单一图像去雾技术”夺得IEEE电脑视觉与模式识别大会(CVPR)该年度的“最佳论文奖”,轰动一时。


汤晓鸥(左)与何恺明


02

创业:从港中文多媒体实验室到商汤科技


在微软工作期间,汤晓鸥还遇到了杨帆,杨帆是2006年加入的微软亚洲研究院创新工程组,负责视觉算法的产品转化,参与了Xbox、Kinect、Windows Hello、Bing图像搜索等视觉技术产品模块的研发,在微软工作近10年之后,杨帆选择加入汤晓鸥创业团队,作为联合创始人、副总裁职务负责商汤智慧城市业务。后来,杨帆还带去了一大波自己的清华学生,商汤的人才队伍开始枝繁叶茂。


商汤科技副总裁杨帆(左)和商汤科技CEO徐立


其实,早在2001年,汤晓鸥就一手建立了香港中文大学多媒体实验室,深入探索计算机视觉领域的研究工作,这间实验室的初创团队就是成立商汤科技的前身。


在成立实验室之后的十年间,汤晓鸥还是IEEE院士,同时担任ICCV(IEEE国际计算机视觉会议)2009 程序委员会的主席。


时间来到2014年,这间实验室迎来重大突破。当年3月份,汤晓鸥团队发布研究成果,基于原创的GaussianFace人脸识别算法,在LFW数据库上准确率达98.52%,首次超越人眼识别能力(97.53%),超过Facebook同时间发布的DeepFace算法(97.35%)。被评为人工智能领域影响因子最高的国际会议AAAI2015的最佳学生论文。


之后他们入选了世界十大人工智能先锋实验室,成为亚洲区唯一入选的团队。福布斯更是称他为“中国人脸识别技术背后的面孔。”


这一年,汤晓鸥作为创始人宣布成立商汤科技,香港中文大学多媒体实验室团队成员徐立担任联合创始人、首席执行官。另一位联合创始人徐冰也来自实验室团队,他上大二时,修读了汤晓鸥的计算机视觉课程,并产生了浓厚兴趣,在大四末期决定加入香港中文大学多媒体实验室攻读博士。后来,他跟随汤晓鸥加入商汤创始团队,担任联合创始人职位。


横跨学界和工业级,让汤晓鸥的眼界更加开阔,对行业也有着更为精准的判断。汤晓鸥创业的早期投资人、IDG资本合伙人牛奎光曾表示,当时飞赴香港看商汤早期团队,只看了五六个计算机识别技术的Demo就决定投资,“这是IDG唯一一个没有看产品就投资的项目。”


可以说,创建商汤科技是学界人工智能科学家面向工业的一次集体实践。作为领航者的汤晓鸥在工业界积累多年,如今,商汤成长为人工智能领域最热门和融资额最高的公司之一。


03

“晒娃狂魔”


“晒娃狂魔”科学家的称号,源自于他一次实验性的研究。


早在微软亚洲研究院工作期间,汤晓鸥的儿子出生了,为了表达爱意并弥补工作忙不能时常陪伴孩子左右的不安,他开始频繁地给儿子拍摄照片,相册几乎涵盖了孩子成长的每个瞬间。


直到照片积攒到成千上万张时,他意识到分类成了难题,想在海量照片里找到某个时间段或某个有趣瞬间的照片非常困难,在计算机视觉技术还远没有今天成熟的时候,他决定一试,叫来几位学生开始研究名为Photo Tagging的课题,采用计算机视觉的技术手段来给相册进行分类整理。



通过计算机视觉技术给人脸进行分类等计算应用,也成为汤晓鸥之后很多演讲场合的经典案例,技术的起源——汤晓鸥的儿子也开始频频亮相他的Presentation,他多次调侃到,我的演讲都是从照片开始的,因为第一,这是我儿子,第二,他长得漂亮。


“原创”一词,同样成为汤晓鸥口中的高频词汇,在商汤AI峰会等多个场合,汤晓鸥提及电影工业和人工智能行业类似,十几年前,很多人去买盗版VCD或者网上下载盗版电影,如果一直持续到今天,恐怕导游和演员就没有动力坚持下去了,今天中国电影市场的繁荣,正是因为我们对于原创和版权的尊重。


人工智能正是如此,在一次演讲中,汤晓鸥以谷歌举例,称这家公司的成功正是得益于对原创的尊重,2014年,有一家公司叫DeepMind,只有12个员工还没有赚钱,只是在用深度学习玩游戏和下棋,但谷歌果断花了6.6亿美金收购了这家公司。


在汤晓鸥看来,如果是在中国,大家就会花几百万美金把人一个个挖过来,因为那要便宜得多,但是如果那样做的话,就是对原创的不尊重,就不会有后来的AlphaGo了。


“AlphaGo开创了一个时代。”他说道。


04

离炮火越远的人越危言耸听


作为中国人工智能行业最资深的老兵,汤晓鸥对于AI的观点句句犀利。


他认为并不存在AI这个行业,只有AI+行业,AI需要与传统产业合作,而且这种关系是结合与赋能,绝不是颠覆,AI的价值是帮助传统产业提高生产效率,解放生产力。


在学术研究方面,他们团队不满足于98.5%的准确率,在2015年,团队用30万人脸进行训练,达到了99.55%的准确率。2016年,他们用6000万人脸训练,达到了百万分之一的误识率。2017年,用20亿人脸训练,达到了一亿分之一的误识率。



在这时,商汤的AI+路线全面铺开,落地应用在了智慧城市、金融、汽车、智慧零售、智能手机、移动互联网、机器人等各行各业,他们提出了1+1+X战略,1代表研发,第二个1代表技术产业化,X代表合作伙伴。


产业落地速度和融资速度并驾齐驱,汤晓鸥的创业团队几乎拔得AI行业头筹。据报道,在2017年上半年,商汤收入实现了480%的增长,客户数量增加到400家,公司估值达到45亿美金。


“我们不烧钱,可以自负盈亏”汤晓鸥认为烧钱就是“败家”。创业成绩的背后,他总结为对于技术原创的坚持和对人才的超乎寻常的重视,拥有百余位人工智能资深博士的研发团队,可以称得上的一笔宝贵的财富。


但前路漫漫,汤晓鸥最近对未来人工智能行业发展还提及了几点建议,一是认为我国人工智能产业布局有同质化,重复建设倾向;另一方面,拔苗助长式地催化人工智能企业,缺乏人工智能技术与产业发展的深度融合。


第二,目前的国际环境对基础研究的合作,特别是与发达国家学术机构的深度合作,造成一定困扰;此外,目前中国走出国门的产业多集中在国有企业的重大基础设施,民营高科技企业还没有形成规模化出口落地。


这都是未来一段时间,中国AI产业在技术之外,可持续发展面临的难题与挑战。


他还认为离AI越远的人越喜欢危言耸听,让AI行业理性,让AI落地赚钱成为2019年整个行业的新使命。


作为离“炮火”最近的人,汤晓鸥正在路上,而且大步向前。


往期推荐

实践者颜水成:在学术界「恋爱」 在工业界「结婚」

▲点击图片观看

「AI天才」何恺明

▲点击图片观看

2019年的人工智能,那些吹过的牛能实现吗?

▲点击图片观看- 加入社群吧 -

网易智能AI社群(AI芯片、医疗AI、金融AI、电商AI、自动驾驶、教育AI、AIoT、机器人等12个社群)火热招募中,对AI感兴趣的小伙伴,添加智能菌微信 kaiwu_club,说明身份即可加入。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存